Cách tạo claude skill chuyên nghiệp hơn với 8 tầng nội dung

Xuất bản vào 10 tháng 03, 2026

Tóm tắt nhanh

Bài viết đi sâu vào vấn đề AI "bay tự do" khi sử dụng Claude Skills và trình bày giải pháp toàn diện: Framework 8 tầng. Đây là một cấu trúc SKILL.md giúp định hình vai trò, ngữ cảnh, đầu vào/đầu ra, bộ quy tắc, và quy trình làm việc của AI một cách rõ ràng. Ngoài ra, bài viết còn giới thiệu cách sử dụng Reference Files để AI học hỏi tone và phong cách thực tế, đảm bảo kết quả ổn định và đúng ý người dùng.

Bạn đã biết skill trong Claude là gì và đã tạo thử vài skills, nhưng kết quả vẫn không ổn định, đôi khi AI làm đúng ý nhưng có lúc lại "bay tự do" theo hướng hoàn toàn khác. Vấn đề thường không nằm hoàn toàn ở Claude, nó nằm ở cái file SKILL.md của bạn: viết thiếu tầng, không có thứ tự, hoặc dồn hết mọi thứ vào một đoạn văn dài không có cấu trúc.

Framework 8 tầng là cách team 4aivn chia sẻ để giải quyết phần đó, đó là chia nhỏ skills thành từng lớp rõ ràng, từ nền tảng đến vận hành. Ở đây team mình áp dụng skills để đưa ra những bài viết chất lượng đến các bạn, còn các bạn hoàn toàn có thể áp dụng vào giải quyết vấn đề của riêng bạn. Nhưng cần nói thẳng đây mới chỉ là Prompt Engineering, chỉ là một phần của bức tranh lớn hơn. Đối với team mình đây là phần giúp team giao việc rõ ràng cho AI, nhưng để ra được bài viết thực sự chất lượng đúng tâm lý người đọc, đúng công thức chuyển đổi, đúng với các tiêu chuẩn bên mình đặt ra còn nhiều thứ phải học hỏi hơn nhiều.

Còn nếu bạn chưa biết skill trong Claude là gì, bạn có thể tham khảo bài này: Claude Agent Skills là skill phải biết về AI trong năm 2026 mang đến mở đầu cho việc tiếp cận skills.

Tại sao cấu trúc Skill lại quyết định tất cả

SKILL.md tất nhiên trông khá giống prompt dài giống cách nhiều người đã làm với ChatGPT, Gemini, Claude vào năm 2024: "Bạn là chuyên gia copywriter 10 năm kinh nghiệm, viết bài theo cấu trúc PAS, tone thấu cảm, cấm dùng từ đột phá, giải pháp hoàn hảo..." Gõ xong, chat xong, đóng lại và lần sau mở chat mới lại phải hướng dẫn lại từ đầu.

Skill khác ở chỗ đó khi mà nó chính là bản hướng dẫn bạn chỉ cần viết một lần là Claude đã hiểu cách làm việc với bạn mà không cần giải thích lại mỗi phiên. Và bây giờ mọi thứ lại thay đổi, prompt là định nghĩa cái gì cần làm lần này, còn skill định nghĩa cách làm việc về lâu dài. Có một vấn đề hay xảy ra ở đây là nhiều người viết SKILL.md giống như viết prompt dài, dồn hết vào một đoạn mà không phân lớp. Claude đọc được, nhưng khi gặp tình huống mới ngoài những gì bạn liệt kê, nó không có khung tư duy để xử lý. Kết quả ra lộn xộn là vì vậy.

Framework 8 tầng chia nội dung SKILL.md thành hai nhóm: 4 tầng nền tảng giúp AI biết nó là ai và làm gì, và 4 tầng vận hành giúp AI biết nó làm như thế nào.

Bốn tầng nền tảng định nghĩa AI là ai

Tầng 1 – Nhiệm vụ

Xác định vai trò cốt lõi của skill này. Đây là câu đầu tiên Claude đọc và dùng để định hình toàn bộ hành vi còn lại.

Ví dụ: "Bạn là editor chuyên viết và biên tập bài về AI cho cộng đồng 4aivn, đối tượng là người Việt quan tâm đến AI nhưng không có nền tảng kỹ thuật."

Tầng 2 – Ngữ cảnh

Mô tả môi trường skill này hoạt động. Cùng một yêu cầu "viết bài AI", nhưng văn phong cho website khác hoàn toàn với fanpage hay trên instagram.

Ví dụ: "Bài viết đăng trên website 4aivn.com, đọc giả chủ yếu đọc trên mobile, cần đoạn văn ngắn, tiêu đề h2 h3 rõ ràng, dài khoảng 1000 đến 1200 từ."

Tầng 3 – Đầu vào

Định nghĩa Claude sẽ nhận thông tin dưới dạng nào. Tầng này thường bị bỏ qua, dẫn đến AI tự suy diễn khi input không rõ ràng.

Ví dụ: "Đầu vào có thể là: một từ khóa đơn, một brief vài dòng, hoặc một outline sẵn. Nếu chỉ nhận từ khóa, phải hỏi thêm trước khi viết."

Tầng 4 – Đầu ra

Xác định kết quả trả về trông như thế nào về format, độ dài, và cấu trúc mặc định.

Ví dụ: "Đầu ra mặc định là bài hoàn chỉnh gồm sapo, 3 đến 4 phần H2, và kết luận. Nếu người dùng chỉ cần dàn ý, trả về outline dạng gạch đầu dòng có mô tả ngắn từng phần."

Bốn tầng vận hành định nghĩa AI này làm việc như thế nào

Tầng 5 – Bộ quy tắc

Đây là tầng quan trọng nhất. Bạn định nghĩa phong cách viết, cấu trúc bắt buộc, và quan trọng không kém danh sách những thứ tuyệt đối không được làm. Càng cụ thể càng tốt.

Ví dụ:

Sapo phải bắt đầu bằng tình huống thực tế hoặc con số bất ngờ, không bao giờ dùng định nghĩa
Mỗi 70% H2 phải là dạng câu hỏi để phù hợp với SEO, GEO và ít nhất mỗi H2 phải có một ví dụ cụ thể
Cấm dùng: "Trong thế giới công nghệ thay đổi nhanh chóng...", "Không thể phủ nhận rằng...", "Hy vọng bài viết hữu ích"

Tầng 6 - Câu hỏi chủ động

Thay vì AI lao vào làm ngay, bạn bắt nó hỏi trước. Tầng này loại bỏ phần lớn trường hợp ra kết quả sai hướng vì AI tự suy diễn yêu cầu.

Ví dụ: "Trước khi viết bất kỳ bài nào, phải đặt ít nhất 3 câu hỏi: đối tượng độc giả là ai, mục tiêu bài là gì (thông tin/thuyết phục/hướng dẫn), và tone muốn dùng (nghiêm túc/gần gũi/trung lập)."

Tầng 7 - Kế hoạch

Sau khi hỏi đủ, AI phải trình bày dàn ý và nêu rõ những quy tắc nó sẽ áp dụng cho bài này trước khi chính thức viết. Bạn thấy được nó đang nghĩ gì và có thể chỉnh hướng trước khi nó đi sai đường.

Ví dụ: "Sau khi nhận đủ thông tin, trình bày: (1) dàn ý đầy đủ với mô tả ngắn từng phần, (2) những từ khóa chính, từ khóa liên quan ưu tiên áp dụng cho bài viết này."

Tầng 8 – Đồng thuận

Chỉ khi người dùng xác nhận đồng ý với kế hoạch, AI mới bắt đầu viết. Không có bước này, các tầng 6 và 7 chỉ là nghi lễ vì AI vẫn có thể tự ý bắt đầu sau khi trình dàn ý.

Ví dụ: "Sau khi trình dàn ý, chờ người dùng xác nhận hoặc yêu cầu chỉnh sửa. Chỉ bắt đầu viết bài hoàn chỉnh khi nhận được tín hiệu đồng ý rõ ràng."

Viết SKILL.md của bạn để áp dụng 8 tầng trên

Tất nhiên đừng cố nhồi nhét đủ 8 tầng trong một lần thực hiện. Thứ tự thực tế để bắt đầu:

Khởi động từ tầng 1 và tầng 5 để xác định rõ AI với vai trò và bộ quy tắc. Chỉ hai tầng này đã tạo ra sự khác biệt rõ ràng nhất so với prompt thông thường. Chạy thử với 1 đến 2 yêu cầu thực tế, xem output có đúng không.
Khi tầng 5 ổn định, thêm tầng 6 để bắt AI hỏi trước xem câu hỏi là gì. Bạn sẽ nhận ra ngay mình hay bỏ sót thông tin gì khi giao việc rồi sau đó thêm tầng 7 và 8 để khép kín vòng kiểm soát.
Các tầng 2, 3, 4 thêm vào khi bạn nhận thấy AI đang tự suy diễn sai về môi trường, định dạng đầu vào, hoặc cấu trúc đầu ra, đó chính là dấu hiệu cần bổ sung.

Reference một phần rất quan trọng của skills

Sau một thời gian dùng skills, bạn sẽ nhận ra một vấn đề mới: AI làm đúng cấu trúc, đúng quy tắc nhưng vẫn thiếu cái gì đó của thương hiệu, vẫn phải chỉnh sửa lại. Tone đúng nhưng chưa giống bạn, cấu trúc đúng nhưng chưa quen như những bài viết cũ.

Đây là lúc Reference phát huy tác dụng.

Reference là gì trong SKILL.md?

Reference là các file bổ sung bạn đặt bên cạnh SKILL.md, nó chứa những thứ quá dài hoặc quá cụ thể để nhét vào bộ quy tắc, nhưng AI cần đọc trong một số trường hợp nhất định.

Với dân viết nội dung, loại Reference hữu ích nhất chính là kết quả đầu ra đã được duyệt, chính những bài viết hoàn chỉnh mà bạn đã hài lòng, dùng làm mẫu tham chiếu để AI có thể học tone và phong cách thực tế của bạn thay vì chỉ đọc quy tắc trừu tượng.

Cách thêm reference vào skill của team mình

Cấu trúc thư mục:

writer-4aivn/

SKILL.md

references/

bai-mau-01.md (bài đã đăng, kết quả ưng ý)

bai-mau-02.md

bai-mau-03.md

Trong SKILL.md, khai báo rõ khi nào Claude cần đọc:

## Reference Files

references/bai-mau-01.md: Đọc khi người dùng yêu cầu viết bài dạng hướng dẫn thực hành

references/bai-mau-02.md: Đọc khi cần tham chiếu tone cho bài phân tích công cụ AI

Đây là claude skills team 4aivn mình đã tạo — Đây là skills team 4aivn mình đã tạo

Quy tắc quan trọng

Đừng để Claude tự quyết định có cần đọc reference không. Chỉ dẫn điều kiện kích hoạt cụ thể, "đọc khi người dùng yêu cầu viết bài dạng X" thay vì "đọc nếu cần". Câu sau quá mơ hồ, Claude sẽ bỏ qua hoặc đọc sai lúc.

Bao nhiêu bài mẫu là đủ?

Bắt đầu với 2 đến 3 bài mẫu thuộc các dạng nội dung khác nhau: hướng dẫn thực hành, phân tích công cụ, bài chia sẻ góc nhìn. Không cần nhiều hơn ở giai đoạn đầu. Mỗi bài mẫu thêm vào là thêm một dẫn chứng giúp AI hiểu tone của bạn rõ hơn một bậc so với chỉ đọc quy tắc.

Nói tóm lại cách tạo skills sẽ mất rất nhiều thời gian trong lần đầu tạo giống như cách chúng ta mất rất nhiều thời gian để tinh chỉnh prompt dài. Nhưng sau khi đã ra kết quả ổn định rồi thì nhiều lúc chúng ta sẽ bất ngờ về những gì Claude có thể viết và làm được.

Đây là phần đầu phần về kỹ năng viết bài cùng AI. Phần đầu này giúp bạn có đầu ra đầu tiên từ skill, nhưng output lần đầu hiếm khi hoàn hảo. Các phần tiếp theo sẽ đi vào sâu hơn nữa vào chỉnh sửa skills cho các vấn đề sâu hơn, cho đến khi AI làm việc đúng như ý bạn.

Thảo luận (0)

Đăng nhập để tham gia thảo luận.

Chưa có bình luận nào. Hãy là người đầu tiên!

Các bài viết liên quan

Agent Harness là gì? Bộ khung giúp AI làm việc hiệu quả

Hãy tưởng tượng bạn có một trợ lý AI vô cùng thông minh nhưng lại rất nhanh quên và không tự kiểm tra được chất lượng công việc của mình. Để giải quyết vấn đề này, các nhà phát triển đã tạo ra một lớp bảo vệ và quản lý bao quanh mô hình AI mang tên agent harness. Đây chính là thứ giúp các trợ lý AI tự động hoàn thành những nhiệm vụ phức tạp mà không cần sự can thiệp liên tục từ con người. Agent harness là gì? Để dễ hình dung, hãy tưởng tượng mô hình AI giống như một nhân viên mới cực kỳ thông minh nhưng lại có trí nhớ rất ngắn hạn và hoàn toàn xa lạ với môi trường làm việc. Nhân viên này có thể giải quyết các bài toán phức tạp trong tích tắc nhưng lại dễ quên mình đang làm gì hoặc vô tình gửi nhầm tài liệu quan trọng cho khách hàng. Trong tình huống đó, agent harness đóng vai trò như một người quản lý giàu kinh nghiệm ngồi ngay bên cạnh để hướng dẫn và giám sát. Nói đơn giản hơn, agent harness là lớp phần mềm bao bọc bên ngoài mô hình AI, đảm nhận mọi công việc hành chính và hậu cần để AI chỉ cần tập trung vào việc suy nghĩ và đưa ra giải pháp. Lớp này kết nối AI với các công cụ bên ngoài, ghi chép lại toàn bộ lịch sử công việc qua nhiều ngày và kiểm tra chất lượng kết quả trước khi coi là xong. Về mặt thực tế, một agent harness thực hiện các nhiệm vụ sau: Kết nối mô hình AI với các công cụ bên ngoài như tìm kiếm web, hòm thư điện tử hay lịch làm việc Lưu trữ toàn bộ tiến trình công việc để AI không phải bắt đầu lại từ đầu ở phiên làm việc tiếp theo Lọc bớt thông tin dư thừa và chỉ cung cấp những dữ liệu cần thiết nhất cho AI tại mỗi bước Giám sát các hành động của AI nhằm ngăn chặn những sai sót nguy hiểm Ghi lại nhật ký hoạt động chi tiết để con người dễ dàng kiểm tra khi cần Nguồn gốc thuật ngữ: Khái niệm "agent harness" được chuyên gia công nghệ Mitchell Hashimoto chính thức đặt tên vào đầu năm 2026. Trước đó, nhiều nhóm phát triển đã xây dựng các hệ thống tương tự nhưng chưa có tên gọi chung cho lớp hạ tầng này. Vì sao AI hay thất bại khi làm việc dài hơi? Điểm yếu lớn nhất của các mô hình AI hiện nay là chúng hoàn toàn không có ký ức dài hạn. Khi bạn mở một cuộc trò chuyện mới, AI bắt đầu từ con số không và không nhớ bất kỳ thông tin nào từ các cuộc trò chuyện trước. Hãy tưởng tượng bạn thuê một nhân viên mà mỗi buổi sáng thức dậy đều quên sạch mọi thỏa thuận và tiến độ công việc từ hôm qua. Khi Anthropic thử nghiệm cho Claude xây dựng một ứng dụng web phức tạp mà không có harness hỗ trợ, kết quả rất đáng thất vọng. Hai lỗi liên tục xuất hiện: AI cố gắng làm tất cả cùng một lúc, bộ nhớ bị quá tải giữa chừng và bỏ dở dự án. Phiên tiếp theo lại tốn thời gian đoán xem đã làm được đến đâu. AI tự tuyên bố hoàn thành công việc mà không chạy thử xem kết quả có thực sự hoạt động hay không. Ngoài hai lỗi trên, việc thực hiện các dự án dài hạn còn khiến AI gặp thêm các vấn đề sau: Bộ nhớ làm việc bị tắc nghẽn: Hàng loạt thông tin phụ tích tụ theo thời gian khiến AI dần mất tập trung vào mục tiêu ban đầu Sử dụng công cụ sai cách: AI đôi khi tìm kiếm thông tin không tồn tại hoặc điền sai thông tin vào biểu mẫu, và nếu không có gì chặn lại sẽ lặp đi lặp lại cùng một lỗi Mất toàn bộ tiến trình khi gặp sự cố: Bất kỳ lỗi mạng hay sự cố hệ thống nào cũng xóa sạch những gì đang lưu trong bộ nhớ tạm Nghiên cứu của Stanford (2023): Các mô hình AI thường bỏ qua thông tin nằm ở giữa một văn bản dài, kể cả khi văn bản đó không quá dài. Đây là lý do vì sao việc nạp quá nhiều dữ liệu vào AI cùng lúc thường phản tác dụng nếu không có bộ lọc hỗ trợ. Agent harness hoạt động ra sao trong thực tế? Một agent harness hoạt động qua hai giai đoạn riêng biệt để đảm bảo công việc diễn ra liên tục và không bị gián đoạn. Giai đoạn chuẩn bị (chỉ diễn ra một lần) Harness thiết lập toàn bộ môi trường làm việc trước khi AI bắt đầu: lập danh sách các việc cần làm, chuẩn bị nơi lưu trữ dữ liệu và ghi lại điểm xuất phát. Giống như người quản lý lập kế hoạch chi tiết trước khi giao việc cho nhân viên, giai đoạn này chỉ cần thực hiện một lần duy nhất. Giai đoạn thực thi (lặp lại nhiều lần) Mỗi khi AI bắt đầu một phiên làm việc mới, harness tự động tải lại toàn bộ tiến độ đã lưu và chỉ giao đúng phần việc tiếp theo. Khi AI muốn thực hiện một hành động như tìm kiếm thông tin hay gửi thông báo, harness kiểm tra độ an toàn của yêu cầu đó trước khi thực hiện, làm sạch kết quả trả về rồi mới đưa lại cho AI xử lý tiếp. AI không bao giờ tương tác trực tiếp với hệ thống bên ngoài mà không qua lớp kiểm soát này. Bốn bộ phận quan trọng tạo nên một agent harness Để giúp AI hoạt động ổn định trong thời gian dài, một agent harness tiêu chuẩn cần có bốn thành phần cốt lõi: Cổng kết nối công cụ bên ngoài: Cho phép AI tương tác với thế giới thực như đọc tài liệu, tìm kiếm web hay gửi thông báo. Harness đóng vai trò trung gian, kiểm tra mỗi yêu cầu trước khi thực hiện và đảm bảo kết quả trả về sạch sẽ, dễ xử lý. Bộ quản lý ký ức nhiều tầng: Duy trì ba loại bộ nhớ phục vụ nhu cầu khác nhau gồm ký ức tạm thời trong phiên hiện tại, nhật ký công việc đang thực hiện và kho kiến thức tích lũy lâu dài qua nhiều dự án. Bộ lọc thông tin thông minh: Tóm tắt lịch sử hội thoại dài thành các ý chính và chỉ cung cấp đúng phần dữ liệu liên quan đến bước hiện tại thay vì nạp tất cả cùng lúc, giúp AI luôn tập trung vào đúng nhiệm vụ. Bộ kiểm tra an toàn và phê duyệt: Tự động xác nhận kết quả trước khi coi tác vụ là hoàn thành. Với các hành động nhạy cảm như xóa dữ liệu quan trọng hay gửi email hàng loạt, harness dừng lại và yêu cầu con người xác nhận trước khi tiếp tục. Lưu ý về dữ liệu tích lũy: Nếu kho ký ức của AI được lưu trữ hoàn toàn trên nền tảng đóng của bên thứ ba, bạn có nguy cơ mất toàn bộ kiến thức tích lũy khi muốn chuyển sang hệ thống khác. Đây là điều cần cân nhắc kỹ khi chọn giải pháp AI agent cho công việc lâu dài. Harness engineering và bí quyết tạo ra hàng triệu dòng code Harness engineering là cách tiếp cận xem mỗi thất bại của AI là một lỗi hệ thống cần khắc phục triệt để, không phải thứ cần thử lại hay bỏ qua. Theo Mitchell Hashimoto, nếu AI mắc lỗi, hãy thiết kế lại môi trường để về mặt vật lý nó không thể mắc lỗi đó nữa. Trong thực tế, khi OpenAI xây dựng các dự án phần mềm lớn với ba kỹ sư tạo ra 3,5 pull request mỗi người mỗi ngày mà không gõ một dòng code nào, họ đã thiết lập cơ chế kiểm tra tự động sau mỗi hành động của AI. Khi AI chạy sai, hệ thống trả về thông báo lỗi được viết theo cấu trúc đặc biệt để AI hiểu ngay mình cần sửa đổi gì ở bước tiếp theo. Mỗi thông báo lỗi trở thành ngữ cảnh học tập, không chỉ là cảnh báo. Một nghiên cứu tại hội thảo ICML năm 2025 cũng chứng minh rằng cùng một mô hình AI khi được trang bị harness luôn vượt trội so với chính nó khi chạy không có harness, kể cả khi không thay đổi gì về cách huấn luyện hay câu lệnh đầu vào. Điều này khẳng định môi trường xung quanh AI quan trọng không kém bản thân model. Góc nhìn thực tế: Claude Code của Anthropic hiện đã vượt 512.000 dòng lập trình và con số này tiếp tục tăng. Model ngày càng mạnh hơn không làm cho harness trở nên đơn giản hơn mà ngược lại, lớp hạ tầng này phát triển thêm để tận dụng tối đa những khả năng mới. Khi nào bạn thực sự cần đến agent harness? Với những việc đơn giản như tóm tắt một tài liệu hay trả lời câu hỏi cụ thể, dùng AI trực tiếp là đủ. Nhưng ngay khi công việc bắt đầu kéo dài hơn một cuộc trò chuyện, cần nhớ thông tin từ lần trước hoặc phải thực hiện nhiều bước theo thứ tự nhất định, đó là lúc harness trở nên cần thiết. Một điểm đáng để suy nghĩ: ngay cả tính năng tìm kiếm web tích hợp sẵn trong ChatGPT hay Gemini cũng chính là một dạng harness. Khi AI tự động tra cứu thông tin, có một lớp hạ tầng phía sau đang thực hiện lệnh gọi công cụ, xử lý kết quả và đưa thông tin sạch vào ngữ cảnh. Harness vô hình với người dùng nhưng không thể thiếu với hệ thống. Agent harness không phải xu hướng kỹ thuật ngắn hạn mà là giải pháp cho những giới hạn cốt lõi của AI: không có ký ức dài hạn, bộ nhớ làm việc có giới hạn và dễ mắc lỗi khi dùng công cụ bên ngoài. 4aivn cũng bất đầu áp dụng Harness vào trong công việc bên mình điều này không chỉ giúp AI hoàn thành tác vụ mà còn biến AI thành hệ thống có thể học từ thất bại và cải thiện theo thời gian.

Nam•

1 thg 6, 2026

Đọc thêm

Anthropic tăng giới hạn sử dụng Claude sau hợp tác với SpaceX

Anthropic vừa công bố hợp tác với SpaceX để tiếp cận hơn 220.000 GPU NVIDIA và ngay lập tức dùng năng lực điện toán mới này để tăng giới hạn sử dụng cho Claude Code lẫn API. Đây là những gì thay đổi và tại sao điều đó quan trọng với người dùng. Tại sao Anthropic lại hợp tác với SpaceX? Trong vài tháng gần đây, Anthropic liên tục ký kết các thỏa thuận điện toán quy mô lớn với Amazon, Google, Microsoft và NVIDIA. Lần này, hãng tiếp tục bổ sung thêm một tên tuổi không ai ngờ tới là SpaceX. Theo thông báo ngày 6/5, Anthropic đã ký thỏa thuận sử dụng toàn bộ năng lực tính toán tại trung tâm dữ liệu Colossus 1 của SpaceX tương đương với hơn 300 megawatt công suất và hơn 220.000 GPU NVIDIA. Toàn bộ năng lực này sẽ được đưa vào sử dụng trong vòng một tháng và sẽ cải thiện trực tiếp trải nghiệm cho người dùng Claude Pro và Claude Max. Colossus 1 là trung tâm dữ liệu AI của SpaceX, hiện là một trong những cụm GPU lớn nhất thế giới. Anthropic là đơn vị thuê toàn bộ năng lực tại đây. Những thay đổi cụ thể về giới hạn sử dụng Nhờ nguồn điện toán mới, Anthropic đã thực hiện ba thay đổi có hiệu lực ngay từ ngày công bố Tăng gấp đôi giới hạn Claude Code theo giờ Giới hạn tốc độ 5 giờ của Claude Code được nhân đôi cho các gói Pro, Max, Team và Enterprise. Nếu trước đây bạn chỉ sử dụng được 10 lệnh chạy Claude Code phức tạp nay được nhân đôi lên thành 20 lần, thay đổi này sẽ giúp ích đáng kể. Tuy nhiên lưu ý là quan trọng là giới hạn tuần (week limit) vẫn giữ nguyên không thay đổi gì cho nên việc tăng giới hạn 5 giờ giúp bạn làm việc cường độ cao hơn trong thời gian ngắn, nhưng có thể khiến bạn chạm mức trần của tuần nhanh hơn. Bỏ giới hạn giờ cao điểm Trước đây, Claude Code tự động giảm giới hạn sử dụng trong khung giờ cao điểm (thường từ 9h sáng đến 3h chiều) đối với tài khoản Pro và Max. Giới hạn này đã được xóa bỏ hoàn toàn vì vậy người dùng giờ đây có thể sử dụng Claude Code với tốc độ đầy đủ bất kể thời điểm trong ngày. Với người dùng thường làm việc vào buổi tối (trùng với giờ bên Mỹ) đây là thay đổi có khả năng có tác động rõ rệt nhất. Tăng mạnh giới hạn API cho các mô hình Claude Opus Giới hạn tốc độ API (rate limit) cho các mô hình Claude Opus được nâng lên đáng kể . Chi tiết mức tăng bằng lần được Anthropic công bố trong bảng sau đây: Thay đổi này đặc biệt quan trọng với các nhà phát triển đang xây dựng ứng dụng trên nền tảng Claude Code Toàn cảnh chiến lược điện toán của Anthropic Thỏa thuận với SpaceX không phải động thái đơn lẻ. Trong vài tháng gần đây, Anthropic đã xây dựng một danh mục đầu tư hạ tầng rất đáng chú ý: Thỏa thuận lên tới 5 gigawatt với Amazon, trong đó gần 1 GW sẽ hoạt động trước cuối 2026 Thỏa thuận 5 GW với Google và Broadcom, dự kiến đưa vào vận hành từ 2027 Quan hệ đối tác chiến lược với Microsoft và NVIDIA, bao gồm 30 tỷ USD năng lực Azure Đầu tư 50 tỷ USD vào hạ tầng AI tại Mỹ cùng Fluidstack Và nay, hơn 300 megawatt từ trung tâm Colossus 1 của SpaceX Anthropic chạy Claude trên nhiều nền tảng phần cứng khác nhau — AWS Trainium, Google TPU và GPU NVIDIA — và cho biết vẫn đang tiếp tục tìm kiếm thêm các nguồn năng lực tính toán mới. Đáng chú ý, trong khuôn khổ thỏa thuận với SpaceX, hai bên cũng bày tỏ quan tâm đến việc phát triển năng lực điện toán AI trên quỹ đạo tức là đặt GPU trên vệ tinh. Đây vẫn là ý tưởng ở giai đoạn rất sớm, nhưng nếu thành hiện thực sẽ là bước ngoặt lớn cho hạ tầng AI toàn cầu. Mở rộng ra thị trường quốc tế Một phần năng lực điện toán mở rộng sẽ được dùng để phục vụ khách hàng doanh nghiệp quốc tế đặc biệt trong các lĩnh vực yêu cầu lưu trữ dữ liệu nội địa như tài chính, y tế và chính phủ. Thỏa thuận với Amazon bao gồm cả năng lực suy luận bổ sung tại châu Á và châu Âu. Anthropic cũng nhấn mạnh rằng họ chỉ mở rộng sang các quốc gia có khung pháp lý dân chủ và chuỗi cung ứng phần cứng an toàn cho thấy một lập trường thể hiện sự thận trọng trong bối cảnh cạnh tranh địa chính trị về AI đang ngày càng gay gắt. Điều này có ý nghĩa gì với người dùng Claude tại Việt Nam? Ở góc độ thực tế, ba thay đổi về giới hạn sử dụng mang lại lợi ích trực tiếp nhất cho những ai đang dùng Claude Code hàng ngày — đặc biệt là lập trình viên và người làm việc liên tục với Claude Code.Việc xóa giới hạn giờ cao điểm cũng có nghĩa là trải nghiệm của người dùng tại Việt Nam (vốn trùng múi giờ với giai đoạn tải nặng tại Mỹ) sẽ ổn định hơn. Về dài hạn, năng lực điện toán lớn hơn thường đồng nghĩa với khả năng triển khai các mô hình mạnh hơn, với chi phí thấp hơn. Đây là nền tảng để Anthropic tiếp tục cạnh tranh với OpenAI và Google trong cuộc đua AI 2026. Anthropic luôn luôn phát triển Anthropic đang đầu tư nghiêm túc vào hạ tầng và hợp tác với SpaceX là bước đi mới nhất trong chiến lược đó. Kết quả gần nhất mà người dùng có thể cảm nhận ngay là Claude Code ít bị giới hạn hơn và tốc độ API chắc chắn sẽ cải thiện. Còn về lâu dài, cuộc chạy đua điện toán giữa các công ty AI lớn hứa hẹn sẽ còn nhiều diễn biến thú vị trong năm 2026.

Nam•

8 thg 5, 2026

Đọc thêm

Claude tích hợp toàn bộ Microsoft 365: Excel, PowerPoint, Word và Outlook đều có trợ lý AI

Anthropic đã ra mắt Claude vào Excel, PowerPoint, Word trước đó và rồi còn mở public beta cho Outlook. Nếu bạn đang theo dõi lịch sử phát hành của Anthropic trong vài tháng gần đây, câu hỏi không còn là họ sẽ ra tính năng gì tiếp theo mà là có phần mềm nào họ chưa nhảy vào không? Claude giờ đã phổ biến trong toàn bộ ứng dụng văn phòng của Microsoft rồi Kể từ nay, tất cả người dùng có gói trả phí đều có thể cài Claude vào bộ ứng dụng văn phòng của Microsoft. Claude for Excel, PowerPoint và Word đã ra mắt từ lâu trong khi Claude for Outlook bước vào giai đoạn thử nghiệm công khai cho toàn bộ các gói trả phí. Điểm khác biệt lớn nhất so với các trợ lý AI văn phòng khác nằm ở chỗ Claude không hoạt động như một chatbot bị nhốt trong từng ứng dụng riêng lẻ. Thay vào đó, ngữ cảnh cuộc hội thoại được duy trì xuyên suốt khi bạn di chuyển giữa các ứng dụng từ Outlook sang Word, rồi Excel, rồi PowerPoint mà không cần giải thích lại từ đầu. Claude for Microsoft 365 có thể cài đặt qua Microsoft AppSource. Một gói duy nhất bao gồm Excel, PowerPoint và Word tuy nhiên có một gói riêng dành cho Outlook. Người dùng có thể triển khai tập trung từ trung tâm quản lý của Microsoft. [VIDEO: F6dzjaBCBtU |Claude for Microsoft 365 (Anthropic)|Claude for Microsoft 365(Anthropic)] Từng ứng dụng làm được gì với Claude? Excel thì đã qua thời chỉ giải thích công thức Claude for Excel đọc được bảng tính nhiều trang, giải thích công thức kèm tham chiếu theo từng ô, xây dựng mô hình tài chính với công thức thực tế và cập nhật các giả định mà không làm vỡ cấu trúc phụ thuộc. Mọi thay đổi đều được theo dõi và hiển thị rõ ràng người dùng luôn biết Claude đã sử dụng ô nào. PowerPoint làm việc trực tiếp trong slide của bạn Đây là điểm đáng chú ý nhất: Claude for PowerPoint đọc cấu trúc slide gốc, nhận diện phông chữ, màu sắc và bố cục hiện có, rồi tạo nội dung mới theo đúng phong cách đó. Biểu đồ tạo ra là biểu đồ PowerPoint gốc có thể chỉnh sửa hoàn toàn, không phải ảnh chụp từ nơi khác dán vào. Word chỉnh sửa có theo dõi và phản hồi bình luận Claude for Word hoạt động theo cách các biên tập viên sẽ thích: mọi chỉnh sửa đều xuất hiện dưới dạng thay đổi có theo dõi, và Claude có thể phản hồi trực tiếp vào các luồng bình luận kể cả giải thích lý do nó sửa gì và tại sao. Không có gì được lưu hoặc gửi đi cho đến khi bạn xác nhận. Outlook (thử nghiệm) sắp xếp hộp thư đến bằng một câu lệnh Claude for Outlook phân loại thư theo ba nhóm: cần bạn trả lời, có thể soạn sẵn thay bạn, và có thể bỏ qua. Các email được soạn thảo xuất hiện ngay trong khung soạn thư của Outlook với đầy đủ người nhận, tiêu đề và nội dung, bạn chỉ cần đọc lại và nhấn gửi đây hoàn toàn những điều mà Claude có thể thực hiện với Gmail. Ngữ cảnh xuyên suốt tính năng nghe quen nhưng hiếm khi thực sự hoạt động Anthropic mô tả kịch bản điển hình như sau: nhận thư trong Outlook, mở tài liệu đính kèm trong Word để soạn bản ghi nhớ, chuyển sang Excel để xây dựng phân tích, rồi biến tất cả thành bộ slides trong PowerPoint và tất nhiên là Claude nhớ hết ngữ cảnh qua từng bước đó. Quan trọng hơn, các tệp có thể mở song song và thay đổi sẽ được đồng bộ: điều chỉnh một giả định trong Excel và con số trong bản ghi nhớ Word cùng biểu đồ trong PowerPoint sẽ tự cập nhật theo. Lịch sử hội thoại được lưu theo từng file tức là bạn có thể đóng thanh công cụ, tắt máy, mở lại ngày hôm sau và tiếp tục đúng chỗ đã dừng. Claude for Microsoft 365 còn hỗ trợ nhập liệu bằng giọng nói thay vì gõ phím. Dành cho doanh nghiệp chắc chắn sẽ phải đầy đủ sự kiểm soát và tuân thủ Với quản trị viên cấp doanh nghiệp, Anthropic bổ sung khả năng cấu hình để truyền toàn bộ các câu lệnh, lệnh gọi công cụ và tham chiếu tài liệu về hệ thống thu thập riêng của tổ chức — giúp đội bảo mật biết chính xác Claude đã làm gì trong từng phiên làm việc. Giao diện phân tích còn phân tách hoạt động theo từng người dùng, từng ứng dụng và từng ngày. Về định tuyến, tổ chức có thể kết nối Claude thông qua tài khoản trực tiếp hoặc qua các nền tảng đám mây hiện có như Amazon, Google Cloud hay Microsoft. Khách hàng Microsoft 365 Copilot cũng có thể truy cập các mô hình Claude trực tiếp trong Excel và PowerPoint. Các quy trình được lưu lại dưới dạng kỹ năng và hoạt động nhất quán trên cả bốn ứng dụng. Khi một quy trình được chuẩn hóa, toàn bộ nhóm có thể dùng theo cùng một cách. Cả thế giới phần mềm đang chạy theo Anthropic Không phải ngoa khi nói rằng Anthropic đang ở giai đoạn phát hành với tốc độ khiến nhiều đối thủ phải giật mình. Chỉ trong vài tháng gần đây: công cụ lập trình Claude Code liên tục cập nhật, hệ sinh thái kết nối mở rộng nhanh chóng, bộ công cụ dành cho trình duyệt và máy tính để bàn được bổ sung, và giờ là cả bốn ứng dụng văn phòng của Microsoft cùng lúc. Microsoft lâu nay vốn đang đặt cược lớn vào Copilot với mô hình độc quyền ChatGPT từ trước đến nay thì nay mở cửa cho Claude vào chính hệ sinh thái của mình. Điều đó nói lên rất nhiều về vị thế hiện tại của Anthropic, tuy nhiên câu chuyện thực sự sẽ do người dùng quyết định: liệu Claude trong Excel, Word, Outlook, Power point có thực sự thay thế được thói quen dùng Microsoft 365 của anh em văn phòng không.

Nam•

8 thg 5, 2026

Đọc thêm

Claude Opus 4.8 ra mắt: model mạnh nhất của Anthropic có gì mới?

Anthropic vừa giới thiệu Claude Opus 4.8, phiên bản được hãng mô tả là model tổng quát mạnh nhất đang phát hành rộng rãi của mình. Bản nâng cấp này không chỉ tăng sức mạnh suy luận cho các tác vụ phức tạp, mà còn bổ sung nhiều thay đổi quan trọng cho nhà phát triển đang xây dựng tác nhân AI , hệ thống coding agent và workflow tự động hóa dài hơi. Điểm đáng chú ý là Claude Opus 4.8 không phải một bản đổi tên đơn thuần từ Opus 4.7 . Anthropic tập trung vào ba hướng chính: xử lý ngữ cảnh dài ổn định hơn, gọi công cụ đáng tin cậy hơn và kiểm soát chi phí tốt hơn trong các vòng lặp agent. Với model ID claude-opus-4-8, phiên bản này đã sẵn sàng cho Claude API và các nền tảng đám mây được hỗ trợ. Claude Opus 4.8 là gì? Claude Opus 4.8 hướng đến các tác vụ đòi hỏi suy luận nhiều bước, lập trình agentic trong thời gian dài và công việc có mức tự chủ cao. Theo tài liệu của Anthropic, model này hỗ trợ cửa sổ ngữ cảnh 1 triệu token mặc định trên Claude API, Amazon Bedrock và Google Vertex AI; riêng Microsoft Foundry hỗ trợ 200.000 token. Model cũng hỗ trợ output tối đa 128.000 token, adaptive thinking và các công cụ nền tảng tương tự Claude Opus 4.7. Điều này giúp nhóm đã dùng Opus 4.7 có thể nâng cấp tương đối nhẹ nhàng, nhưng vẫn cần kiểm tra một số thay đổi hành vi và ràng buộc API để tránh lỗi khi triển khai production. Những tính năng mới nổi bật Claude Opus 4.8 mang đến một số cập nhật trực tiếp tác động đến cách thiết kế prompt, quản lý hội thoại dài và tối ưu chi phí khi dùng API. Đây là những thay đổi rất đáng chú ý nếu bạn đang vận hành chatbot chuyên sâu, coding assistant hoặc agent nhiều bước. System messages giữa hội thoại Một điểm mới quan trọng là Claude Opus 4.8 cho phép thêm message có role: "system" ngay sau lượt người dùng trong mảng messages, miễn là tuân thủ quy tắc đặt message của Anthropic. Thay đổi này giúp developer cập nhật chỉ dẫn ở giữa một cuộc hội thoại dài mà không phải gửi lại toàn bộ system prompt ban đầu. Trong thực tế, đây là lợi thế lớn cho các agent phải chạy nhiều vòng. Thay vì làm mất hiệu quả prompt cache vì lặp lại phần chỉ dẫn dài, ứng dụng có thể bổ sung hướng dẫn mới đúng thời điểm, giữ lại cache cho phần hội thoại trước đó và giảm chi phí input trong các luồng xử lý kéo dài. Fast mode cho Claude API Anthropic cũng đưa fast mode vào Claude Opus 4.8 dưới dạng research preview trên Claude API. Khi đặt speed: "fast", người dùng có thể nhận tốc độ sinh output token cao hơn, với mức tăng được Anthropic mô tả là lên đến 2,5 lần trong điều kiện hỗ trợ. Fast mode sẽ đặc biệt hữu ích với các sản phẩm cần phản hồi nhanh nhưng vẫn muốn dùng cùng một model Opus mạnh. Tuy nhiên, tài liệu cũng lưu ý chế độ này đi kèm mức giá premium, vì vậy các đội kỹ thuật nên dùng có chọn lọc cho những luồng có giá trị cao hoặc yêu cầu độ trễ thấp. Prompt caching dễ dùng hơn Với Claude Opus 4.8, ngưỡng tối thiểu để một prompt có thể cache giảm xuống 1.024 token. Đây là thay đổi nhỏ nhưng có tác động thực tế lớn, vì nhiều prompt trước đây chưa đủ dài để tạo cache entry trên Opus 4.7 nay có thể được cache mà không cần sửa code. Đối với sản phẩm có system prompt ổn định, tài liệu nội bộ dài hoặc nhiều lượt gọi API lặp lại, prompt caching có thể giúp giảm chi phí đáng kể. Khi kết hợp với system messages giữa hội thoại, Claude Opus 4.8 trở nên phù hợp hơn cho các agent phải duy trì trạng thái qua nhiều bước xử lý. Refusal stop details được tài liệu hóa Anthropic cũng công khai tài liệu về đối tượng stop_details trong phản hồi từ chối. Khi model không thể hoàn thành một yêu cầu, ứng dụng không chỉ nhận stop reason dạng refusal, mà còn có thêm thông tin phân loại để hiểu vì sao yêu cầu bị từ chối. Điều này giúp sản phẩm xử lý UX tốt hơn. Ví dụ, thay vì hiển thị một thông báo lỗi chung chung, ứng dụng có thể phân biệt các nhóm từ chối khác nhau và hướng người dùng sang bước tiếp theo phù hợp hơn. Các ràng buộc API cần lưu ý Dù Anthropic nói các ràng buộc này kế thừa từ Claude Opus 4.7 và không phải breaking change với code đã chạy ổn trên bản trước, developer vẫn nên kiểm tra kỹ. Trên Messages API, Claude Opus 4.8 không hỗ trợ đặt temperature, top_p hoặc top_k sang giá trị không mặc định. Nếu truyền các tham số sampling này, API sẽ trả lỗi 400. Một điểm khác là adaptive thinking là chế độ thinking duy nhất được hỗ trợ. Cách cấu hình kiểu cũ với ngân sách thinking token cố định không còn phù hợp cho Opus 4.8. Thay vào đó, Anthropic khuyến nghị dùng thinking: {"type": "adaptive"} và điều chỉnh độ sâu suy luận bằng tham số effort. Trên Claude Opus 4.8, effort mặc định là high trên mọi bề mặt, bao gồm Claude API và Claude Code. Nếu ứng dụng đã đặt effort rõ ràng, cấu hình hiện tại vẫn được giữ nguyên; nếu chưa đặt, hành vi mặc định có thể khác so với kỳ vọng trước đây và cần được kiểm thử lại. Ý nghĩa với coding agent và workflow dài hơi Anthropic cho biết Claude Opus 4.8 nhắm đến các cải tiến trong coding agent dài hơi, bao gồm xử lý long-context tốt hơn, ít phải compaction hơn và phục hồi sau compaction ổn định hơn. Đây là nhóm tác vụ mà các model lớn thường gặp khó: sau nhiều bước đọc file, sửa code, chạy test và tóm tắt trạng thái, agent dễ mất trọng tâm hoặc bỏ qua chi tiết quan trọng. Model mới cũng được tối ưu để kích hoạt công cụ đúng lúc hơn. Với các hệ thống cần gọi search, database, terminal, browser hoặc API nội bộ, việc model ít bỏ sót tool call có thể tạo khác biệt lớn về độ tin cậy. Đây là điểm quan trọng hơn cả benchmark đơn lẻ, vì chất lượng agent trong môi trường thực tế phụ thuộc rất nhiều vào khả năng biết khi nào cần dùng công cụ. Có nên nâng cấp lên Claude Opus 4.8? Nếu bạn đang dùng Claude Opus 4.7 cho tác vụ suy luận phức tạp, lập trình hoặc agent tự động, Opus 4.8 là bản nâng cấp đáng thử sớm. Các thay đổi như context 1 triệu token, prompt cache minimum thấp hơn và system messages giữa hội thoại đều hướng đến bài toán vận hành thực tế, không chỉ cải thiện chất lượng trả lời trong các prompt ngắn. Tuy vậy, đội kỹ thuật không nên nâng cấp mù quáng. Hãy rà lại các tham số sampling, cấu hình thinking, kỳ vọng về effort mặc định và chi phí nếu muốn dùng fast mode. Với các sản phẩm đang xử lý dữ liệu nhạy cảm hoặc workflow quan trọng, nên chạy A/B test trên một nhóm tác vụ đại diện trước khi chuyển toàn bộ traffic sang Claude Opus 4.8. Kết luận Claude Opus 4.8 cho thấy Anthropic đang tập trung mạnh vào thị trường agent và developer. Các cải tiến lần này không chỉ nằm ở khả năng suy luận, mà còn ở những chi tiết vận hành như cache, system message giữa hội thoại, tốc độ output và phân loại refusal. Với những ai xây dựng sản phẩm AI nghiêm túc, đây là một bản phát hành đáng theo dõi vì nó giải quyết nhiều vấn đề rất thực tế trong triển khai ứng dụng AI dài hạn.

Nam•

29 thg 5, 2026

Đọc thêm